华为开发者贡献Linux内核补丁，将核心内核函数速度提升715倍

OSC开源社区 2023-01-28

收录于合集 #linux内核 18个

出品 | OSC开源社区（ID：oschina2013)

Linux 6.2 近日合并了一个重要补丁，该补丁能够将一个核心内核函数速度提升 715 倍。

从合并的注释可知，贡献此补丁的维护者 Zhen Lei 来自华为，他将 kallsyms_lookup_name () 的平均查找性能提高了 715 倍，从而使内核里面旧实现的时间复杂度从 O (n) 升级到 O (log (n))，大幅减少查找时间，同时还保留了 /proc/kallsyms 上旧的实现支持。

kallsyms_lookup_name () 函数用于根据名称查找符号的地址，并可用于查找内核符号表中的任何符号。

Zhen Lei 曾在较早的补丁中描述了 kallsyms_lookup_name () 的优化思路：

目前，要搜索一个符号，我们需要将 'kallsyms_names' 中的符号一个一个展开，然后使用展开后的字符串进行比较。这种算法的时间复杂度是 O (n)。
如果我们像地址一样按升序对名称进行排序，则可以使用二分查找。这种算法的时间复杂度是 O (log (n))。
为了不改变 “/proc/kallsyms” 的实现，表 kallsyms_names [] 仍然按照升序与地址一一对应存储。
添加数组 kallsyms_seqs_of_names []，以排序后的 names 序号为索引，对应的内容为排序后的地址序号。例如：假设 NameX 在数组 kallsyms_seqs_of_names [] 中的索引为 'i'，kallsyms_seqs_of_names [i] 的内容为 'k'，则 NameX 对应的地址为 kallsyms_addresses [k]。kallsyms_names [] 中的偏移量是 get_symbol_offset (k)。
请注意，使用此方法内存使用量将增加 (4 * kallsyms_num_syms) 字节，接下来的两个补丁将减少 (1 * kallsyms_num_syms) 字节并正确处理 CONFIG_LTO_CLANG=y 的情况。
性能测试结果：(x86)
Before:
min=234, max=10364402, avg=5206926
min=267, max=11168517, avg=5207587
After:
min=1016, max=90894, avg=7272
min=1014, max=93470, avg=7293
kallsyms_lookup_name () 的平均查找性能提高了 715 倍。

因此，该补丁带来的唯一缺点是将内存占用量增加 3 * kallsyms_num_syms。

Linux 6.2 的模块代码还包含一个小的启动优化，将启动时间缩短了大约 30 毫秒。

相关链接：https://git.kernel.org/pub/scm/linux/kernel/git/torvalds/linux.git/commit/?id=3ba2c3ff98ea8bfb219288dbacf2a23a902c751b

往期推荐

谷歌发文批评苹果：实在是 “拖大家后腿”

《2022 年度 OSC 中国开源项目评选》正式启动

2022需求最大的8种编程语言

这里有最新开源资讯、软件更新、技术干货等内容

点这里 ↓↓↓ 记得关注✔ 标星⭐ 哦~

“占坑式辩护”，侵犯了谁？

bxrf的瓜

嗷嗷哭！三斤午夜痛哭，压力太大了！阿哲遭恶意举报，爆瓜内幕！

童锦程爆阿哲抖音年度！哦嫂猫猫抖音复出开播！北王示爱囧囧丸！

陈泽心疼阿哲，回应大舞台节奏！哲修辰杭州聚会！宇文泡1600万叫价青蛙哥！

华为开发者贡献Linux内核补丁，将核心内核函数速度提升715倍

《2022 年度 OSC 中国开源项目评选》正式启动

2022需求最大的8种编程语言

您可能也对以下帖子感兴趣

“占坑式辩护”，侵犯了谁？

bxrf的瓜

嗷嗷哭！三斤午夜痛哭，压力太大了！阿哲遭恶意举报，爆瓜内幕！

童锦程爆阿哲抖音年度！哦嫂猫猫抖音复出开播！北王示爱囧囧丸！

陈泽心疼阿哲，回应大舞台节奏！哲修辰杭州聚会！宇文泡1600万叫价青蛙哥！

生成图片，分享到微信朋友圈

华为开发者贡献Linux内核补丁，将核心内核函数速度提升715倍

《2022 年度 OSC 中国开源项目评选》正式启动

2022需求最大的8种编程语言

您可能也对以下帖子感兴趣